| RuSSIR: последний шанс |
[May. 17th, 2012|10:27 am] |
Осталась всего неделя до конца приема заявок на RuSSIR.
Между тем, на сайте школы опубликована окончательная программа: http://romip.ru/russir2012/section.php?id=127
Напоминаем, что основной темой этого года стали многоязычные приложения. А в самом начале школы будет проведен мини-курс "Ведение в информационный поиск". |
|
|
| Анализ текста на естественном языке, управляемый вариантами разбора |
[May. 16th, 2012|08:36 pm] |
Уважаемые коллеги,
19 мая состоится заключительный семинар по автоматической обработке естественного языка в этом сезоне.
С докладом на тему "Анализ текста на естественном языке, управляемый вариантами разбора" выступит аспирант факультета вычислительной математики и кибернетики МГУ Алексей Носков.
Общепринятой схемой обработки теста на естественном языке (ЕЯ) является последовательность независимых этапов его анализа на основных уровнях, включая графематический, морфологический и синтаксический анализ. На каждом этапе в общем случае возникают многочисленные варианты разбора отдельных единиц текста, окончательный выбор между которыми часто может быть сделан только на последующих этапах, что представляет одну из сложностей обработки ЕЯ и приводит к появлению промежуточных этапов, таких как постморфология. В докладе рассматривается подход к обработке текстов на ЕЯ, в рамках которого варианты разбора, возникающие на основных этапах анализа, обрабатываются последовательно, а сами этапы анализа выполняются одновременно. Подход иллюстрируется реализацией поверхностно-синтаксического анализа текста по лингвистическим шаблонам, подобным шаблонам языка LSPL (www.lspl.ru) и языка JAPE (системы GATE: www.gate.ac.uk).
Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00. Пароль для прохода через вахту: "Я на семинар". |
|
|
| RCDL 2012 |
[May. 15th, 2012|11:01 am] |
Наступила последняя неделя приёма расширенных тезисов докладов на XIV Всероссийскую научную конференцию RCDL-2012 "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", которая пройдёт в г. Переславль-Залесский, 15 - 18 октября 2012 года.
Каждая работа будет тщательно изучена и отрецензирована несколькими членами программного комитета. Не позднее 24 июня программный комитет сообщит Вам о своём решении. В случае принятия доклада Вы сможете за лето подготовить окончательную публикацию по шаблонам в форматах DocX, ODT и LaTeX, доступным с сайта конференции.
Очень надеемся на Ваше понимание и участие.
Подробная информация о конференции представлена на нашем веб-сайте http://rcdl2012.pereslavl.ru.
Мы будем признательны, если Вы проинформируете своих коллег о возможности участия в нашей конференции.
При возникновении любых затруднений просим обращаться по указанным на сайте адресам.
Сопредседатели программного комитета
Сергей Витальевич Знаменский Михаил Рувимович Когаловский |
|
|
| Real-world text mining using machine learning |
[Apr. 16th, 2012|08:35 pm] |
Дорогие коллеги!
В ближайшую субботу, 21 апреля, на семинаре по автоматической обработке естественного языка выступит профессор Ян Жижка (Чехия).
Ян прочтет доклад на тему "Real-world text mining using machine learning". Продолжительность доклада - 3 часа. Внимание - семинар будет проходить на АНГЛИЙСКОМ языке.
Аннотация: Today, huge volumes of text data are available, especially on the Internet. Very often, the data is not structured and the text is freely written by the Internet users in natural languages. Such the data is expected to contain interesting or valuable information that can be used for different goals in a lot of application areas. Because the data is too big, it is very difficult or impossible to process it "manually" within an acceptable time. Fortunately, modern informatics procedures and methods enable us to apply sophisticated methods included in artificial intelligence, especially the set of algorithms called machine learning. Machine learning methods applied to text mining are based on the inductive learning from existing examples.
In the first part, the talk deals with a brief introduction to some machine learning methods applied to text mining. The main problems are connected with the appropriate preprocessing of the data, designing the mining procedure including selection of suitable algorithms and interpreting the results.
In the second part, some interesting results obtained from the real-world data will be presented. The data represents opinions/sentiments of customers' reviews relating to services provided by hotel accommodation all over the world. The reviews are written by hundreds of thousands of customers in many languages. The focus of the described research was on revealing typical words and phrases in several languages, including English, Spanish, French, German, Japanese, Russian, Czech, and others.
Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00. Пароль для прохода через вахту: "Я на семинар". |
|
|
| Преобразование структур зависимостей |
[Apr. 4th, 2012|05:03 pm] |
Уважаемые коллеги,
В ближайшую субботу, 7 апреля, в 17:00 состоится очередной семинар по автоматической обработке естественного языка.
Ангелина Иванова (University of Oslo) представит доклад на тему "Преобразование структур зависимостей".
Инициативой DELPH-IN разработан синтаксически размеченный корпус LinGO Redwoods. Корпус аннотирован вручную в рамках формальной грамматики LinGO English Resource Grammar. Каждое предложение снабжено двумя видами древовидных структур: (1) синтаксическим деревом (DELPH-IN derivation tree), (2) семантическим графом зависимостей в формате Minimal Recursion Semantics - MRS. Для того, чтобы ресурс можно было использовать для задач синтаксического анализа с помощью различных парсеров, необходимо обеспечить его совместимость с общепринятыми схемами представления синтакто-семантических зависимостей. С этой целью ведется работа над автоматическим конвертером, который преобразует HPSG-структуры в структуры зависимостей, представляющие отношения между отдельными словами. Конвертер трансформирует синтаксические деревья и семантические графы независимо. Доклад будет посвящен описанию конвертера и сравнительному анализу полученных представлений с наиболее известными схемами зависимостей (CoNLL,Stanford, EnjuPredicate - Argument Structures).
Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Пароль для прохода через вахту: "Я на семинар". |
|
|
| инженерия гуманитарного знания: магистратура |
[Mar. 26th, 2012|09:12 am] |
Кафедра информационных систем в искусстве и гуманитарных науках СПбГУ в рамках направления 230700 «Прикладная информатика» открывает прием в магистратуру по образовательной программе «Инженерия гуманитарных знаний». Срок обучения 2 года. Обучение завершается защитой магистерской диссертации. Учебный план предусматривает, в том числе, следующие курсы: «Методы и модели онтологической инженерии», «Системы понимания текста» «Модели анализа текста и их программная реализация», «Статистические методы в языковой инженерии», «Корпусные методы в языковой инженерии», «Лингвистика текста и теория речевой коммуникации», «Методы программной реализации интеллектуальных информационных технологий». В 2012 планируется второй набор студентов в магистратуру. Обучение на бюджетной (пять мест) и коммерческой основе. В настоящее время обучение проходят четверо студентов, планируется защита диссертаций по следующим темам: 1. Автоматизация выбора параметров для лингвистически адекватного извлечения коллокаций 2. Распознавание именованных сущностей методами машинного обучения 3. Анализ кореференции в задаче извлечения информации 4. OWL-конвертирование онтологий (на примере онтологии IntTez) К преподаванию привлечены ведущие преподаватели СПбГУ, а также специалисты, практически работающие в известных научных и коммерческих организациях. Подробности о магистратуре можно узнать на нашем сайте. Также приглашаем всех интересующихся на презентацию магистратуры, которая пройдет 27 апреля в 15.00, по адресу СПб, 10-я линия В.О., д. 49 ауд. 308 |
|
|
| Анализ естественного языка в моделировании требований для CASE-технологий |
[Mar. 22nd, 2012|12:57 pm] |
Уважаемые коллеги,
В субботу, 24 марта, состоится очередной семинар по автоматической обработке естественного языка.
С докладом на тему "Анализ естественного языка в моделировании требований для CASE-технологий" выступит Вадим Нуриахметов (ТулГУ).
В докладе излагается подход к решению задачи построения всех понятий на формальном контексте. Данный подход основывается на применении концептуальных графов. Это позволяет для текстов на естественном языке строить конкретные контексты пониженной размерности и находить на них понятия, выявляя в тексте объекты и их атрибуты. Данный подход снижает сложность задачи построения понятий. В предложенной работе исследуются концептуальные графы вместе с формальным контекстом, как промежуточная модель между естественным языком и CASE моделью. Они являются дополнительным инструментом в CASE технологиях, который помогает разработчикам информационных систем проектировать CASE модели. В разработанной системе используется специальный генератор концептуальных графов с управляемым алгоритмом генерации шаблонов. Генератор концептуальных графов был успешно испытан на русских и английских текстах.
Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00. Пароль для прохода через вахту: "Я на семинар".
|
|
|
| navigation |
| [ |
viewing |
| |
most recent entries |
] |
| [ |
go |
| |
earlier |
] |
| |
|
|